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使 天 文学 时 代 的 到 来 。 

地 基 激 光 干涉 仪 探 测 器 的 灵敏 探测 频段 是 10 ~ 103 Hz， 主 要 探测 双 中 子 星 和 恒星 级 双 
黑洞 并 合 释放 的 引力 波 信号 。 除 了 地 面 引力 波 探测 器 外 ， 空 间 引 力 波 探测 器 也 在 计划 中 。 空 
间 激 光 干 涉 引力 波 探测 器 探测 引力 波 的 频段 为 10-4 ~ 1 Hz， 主 要 探测 银河 系 内 大 量 的 双 
白矮星 系 、 极 端 和 中 等 质量 比 双 星系 统 等 。 空 间 引 力 波 探测 器 (Laser Interferometer Space 
Antenna, LISA) 被 列 为 欧洲 航空 局 的 L3 计划 ”， 中 国 天 琴 ” 和 太极 ”也 在 规划 当中 。2019 
年 8 月 31 日 ， 微 重力 技术 实验 卫星 “太极 1 号 ”在 酒泉 卫星 发 射 中 心 成 功 发 射 ， 各 项 测试 
结果 正常 。2019 年 12 月 20 日 ， 天 琴 计 划 的 第 一 颗 技 术 实 验 卫 星 ,“ 天 琴 1 号 ”在 太原 卫星 
发 射 中 心 成 功 发 射 升 空 。 目 前 引力 波 探测 实验 卫星 LISA Pathfinder、 太 极 1 号 、 天 琴 1 号 
都 运行 非常 成 功 ， 预 计 21 世纪 30 年 代 空 间 引 力 波 探测 器 将 会 运行 ， 多 频段 引力 波 探测 时 代 
将 会 到 来 。 

引力 波 探测 需要 数学 、 物 理学 、 计 算 机 科学 等 多 学 科 协 同 攻关 ， 并 且 交 叉 融 合 呈 。 
LIGO 的 精度 可 以 达到 10-22 量 级 ， 在 测量 的 信号 中 ， 背 景 噪声 通常 大 于 引力 波 信号 ， 要 通 
过 数据 分 析 流 水 线 来 搜索 信号 中 的 瞬 态 引力 波 模 式 。 引 力 波 数据 分 析 流水 线 包 括 PyCBC™, 
GstLAL™, SPIIR™ 等 ， 在 加 州 理 工学 院 、 麻 省 理工 学 院 、 汉 福 德 观测 站 、 利 文 斯 顿 观测 
站 等 约 7 万 CPU 核心 和 数 干 块 高 性 能 计算 显卡 上 运行 。 
国 、 澳 洲 和 美国 的 科研 工作 者 共同 开发 的 匹配 滤波 算法 SPIIR™， 创 造 性 地 由 并 行 
时 间 平 移 的 一 阶 IR 滤波 器 构造 匹配 滤波 器 ， 把 模板 库 中 的 模板 映射 到 大 量 的 时 间 平 移 IIR. 
滤波 器 参数 ， 使 算法 更 易于 并 行 和 扩展 。 引 力 波 数 据 分 析 流 水 线 有 离线 和 在 线 两 种 工作 模 
式 ， 后 者 的 数据 处 理 延 时 可 以 达到 分 钟 量 级 。 多 信使 天 文学 的 顺利 开展 需要 更 低 的 计算 延 
时 ， 实 时 探测 推断 的 天 空 方位 可 以 与 电磁 探测 望远镜 共享 ， 以 便 快速 寻找 相关 方位 的 电磁 
信号 。 

Æ LIGO 数据 处 理 流水 线 中 ， 己 经 融入 机 器 学 习 方法 。LIGO 通过 约 5000 个 快 数据 通 
道 和 约 20 万 个 慢 数 据 通 道 的 分 析 得 到 信号 质量 的 好 十， 频率 为 60 Hz 的 交流 电源 的 非 线 性 
耦合 瞬 态 噪声 已 经 可 以 通过 机 器 学 习 法 线 下 去 除 ”” 。 我 们 相信 机 器 学 习 方 法 也 必 将 应 用 于 
引力 波 的 探测 、 定 位 和 波源 参数 反 演 等 。 深 度 学 习 有 望 集成 到 引力 波 数据 分 析 流 水 线 中 ， 苦 
代 匹 配 滤波 的 低 延 迟 分 析 ， 助 力 引力 波 探测 实时 分 析 。 

深度 学 习 在 计算 机 视觉 、 声 音信 号 处 理 、 医 疗 诊断 等 方面 的 应 用 已 经 取得 显著 的 成 
效 ， 在 引力 波 数据 处 理 方面 的 应 用 还 在 探索 中 。2018 年 ，Gabbard “ A". George 和 
Huerta 几乎 同时 发 现 ， 深 度 学 习 在 引力 波 探测 方面 可 以 达到 匹配 滤波 的 精度 。 与 匹配 波 
波 相 比 ， 深 度 学 习 的 计算 效率 大 大 提高 ， 有 望 应 用 于 瞬 态 引力 波 模式 的 实时 检测 。 后 来 ， 
George 和 Huevta 将 深度 学 习 模型 应 用 于 真实 的 LIGO 噪声 信号 ， 发 现 其 与 仿真 噪声 信号 
一 致 。 近 几 年 许多 工作 对 深度 学 习 引力 波 探测 进行 了 研究 ， 这 些 研究 可 以 划分 为 模型 优化 、 
点 用 拓展 、 应 用 细 化 和 机 理 研 究 。 

2019 年 ，Gebhard $% A 使 用 空洞 卷 积 神经 网 络 对 引力 波 探测 进行 了 研究 ， 他 们 发 现 
空洞 卷 积 神经 网 络 可 以 有 效 检 测 致密 双星 并 合 引力 波 信号 的 有 无 。2020 年 ，Wang 等 人 ”在 
卷 积 神经 网 络 基础 上 加 入 匹配 感知 层 ， 得 到 一 种 新 的 网 络 结构 ， 该 网 络 的 感知 层 利 用 几 十 个 
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波形 模板 模拟 匹配 滤波 的 过 程 。Li 等 人 通过 小 波 分 解 对 信号 进行 预 处 理 ， 基 于 Gabbard 
模型 对 参数 进行 调整 ， 得 到 优化 的 模型 。Luo 等 人 研究 发 现 ， 通 过 对 模型 中 dropout 层 的 
改进 可 以 增加 探测 精度 。Deighan 等 人 ”采用 遗传 算法 对 George 和 Huerta 的 模型 进行 优 
化 ， 得 到 一 个 参数 数量 为 原 模型 的 78% 但 精度 提高 11% 的 模型 。2021 年 ，Xia AM 对 着 
积 神经 网 络 结构 在 引力 波 探 测 方 面 的 泛 化 能 力 做 了 研究 ， 他 们 以 George 和 Huerta 的 模型 
为 基础 ， 通 过 dropout 和 BN 优化 了 模型 的 性 能 ， 并 对 输入 输出 的 统计 特性 进行 研究 后 得 
出 ， 模 型 对 不 同 的 输入 参数 空间 具有 不 同 的 输出 统计 特性 。Huerta 团队 集成 两 个 卷 积 神经 
网 络 得 到 一 个 新 模型 ， 该 模型 可 以 对 引力 波 探测 网 络 的 数据 进行 并 发 分 析 

除了 应 用 于 致密 双星 引力 波 信 号 探测 外 ， 科 研 人 员 应 用 深度 学 习 对 波源 参数 的 预测 与 定 
位 、 引 力 波 去 噪 ””、 连 续 引 力 波 探测 ”、 星 体 藤 缩 引力 波 探测 ”等 进行 了 研究 。 
2019 年 ，Huerta 团队 构建 深度 模型 预测 双星 的 质量 、 自 旋 等 参数 ， 得 到 的 结果 与 贝 叶 斯 分 
析 方 法 一 致 ， n 
2020 年 ， 该 团队 又 将 应 用 于 语音 信号 处 理 的 WaveNet HRAS IRER, Fan SA 创 
新 性 地 将 引力 波 探 测 和 波源 参数 估算 融合 在 一 个 模型 中 ， ALT. T NE 直观 测 站 数 
量 的 变化 。2021 年 重庆 大 学 李 瑾 团队 采用 机 器 学 习 对 脉冲 星 计 时 阵列 信号 进行 分 析 ， 研 究 
了 纳 赫兹 波段 引力 波 的 探测 问题 ” 。 

本 文 以 LIGO O1 真实 噪声 数据 为 基础 ， 研 究 了 不 同 网 络 结构 复杂 度 的 深度 模型 对 引力 
波 探测 的 影响 ， 第 2 章 回顾 了 匹配 滤波 和 卷 积 神经 网 络 的 数学 表达 式 ， 发 现 两 者 的 一 致 性 ; 
第 3 章 和 第 4 章 分 别 介绍 了 应 用 于 模型 训练 和 测试 的 数据 集 和 模型 的 结构 ， 第 5 章 对 实验 结 
果 进 行 了 展示 和 分 析 。 


2 匹配 滤波 与 卷 积 神经 网 络 的 一 致 性 


2.1 ”匹配 滤波 法 
在 平稳 高 斯 可 加 背景 噪声 假设 下 ， 可 以 得 到 最 优 线 性 引力 波 探测 方法 一 一 匹配 滤波 法 。 
假设 s(t) 为 LIGO 获取 的 应 变 信号 ，hi(t) e T 为 匹配 模板 ， 其 中 了 为 模板 库 ， 则 模板 hilt) 


对 应 的 匹配 滤波 输出 为 : 
L [SAAD jorpe 
z(t) [. San(f) odf (1) 


KH, 8(f) 和 及 (了 ) DHA s(t) 和 hilt) KEEFER. Sanl 为 信号 的 双边 功率 谱 ， 与 单 
边 功率 谱 5,(t) 的 关系 为 : 
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= i "eT (4) 


LIGO 获取 的 应 变数 据 为 离散 时 间 信 号 sin] = s(nT), EP T AKER, 对 上 式 进 行 离散 
化 后 得 到 : 


ziln] =TY zmhilm—n)] ， (5) 
KP, hiin] = hi(nT)。 则 匹配 滤波 的 输出 为 : 
z[n| = max (ziln]) . (6) 


2.2 ” 卷 积 神经 网 络 中 的 卷 积 层 

卷 积 神经 网 络 由 输入 层 、 输 出 层 和 若干 隐藏 层 构 成 。 隐 藏 层 可 以 由 卷 积 、 池 化 、 全 连接 
层 等 层 层 堆 登 实现 ， 每 一 层 都 可 以 看 成 具有 输入 输出 的 系统 。 卷 积 层 可 以 由 卷 积 核 的 大 小 、 
数量 等 确定 ， 假 设 卷 积 层 的 输入 为 z[n]， 第 i 个 卷 积 核 为 wi[n]， 则 其 产生 输出 : 


yiln] = zimwi- m] ， (7) 


m 


$ rit) = hi(—t)T, XX (5) A: 
Ziln| = ` z|m|ri[n—m]. (8) 


m 


对 比 式 (7) 和 式 (8)， 我 们 可 以 得 出 ， 匹 配 滤波 可 以 看 作 具 有 一 层 卷 积 层 ( 卷 积 核 参 数 构成 了 
匹配 模板 库 ) 的 卷 积 神经 网 络 模型 。 
2.3 ”模型 宽度 和 深度 研究 的 必要 性 

我 们 把 每 层 卷 积 核 的 数量 称 为 模型 的 宽度 ， 卷 积 层 的 层 数 称 为 模型 的 深度 。 匹 配 滤波 属 
于 宽度 很 宽 ， 深 度 只 有 一 层 的 卷 积 神经 网 络 。 信 和 号 与 模板 直接 匹配 感知 的 匹配 滤波 法 计算 效 
率 低 。 已 有 的 深度 学 习 引 力 波 探测 模型 ， 通 过 提高 模型 的 深度 来 降低 模型 参数 数量 ， 进 而 提 
高 计算 效率 。 按 照 当前 LIGO 设计 灵敏 度 ， 引 力 波 探测 模型 的 虚 警 概率 必须 非常 低 ， 低 至 
万 分 之 一 才能 应 用 于 引力 波 探测 。 在 应 用 于 在 线 实 时 探测 前 ， 必 须 对 深度 学 习 引 力 波 探测 
方法 的 优化 进行 更 加 全 面 的 研究 。 卷 积 神经 网 络 宽度 和 深度 的 平衡 能 否 兼 顾 效率 和 可 靠 性 ， 
仍然 需要 研究 。 本 文 对 深度 模型 的 宽度 和 深度 在 引力 波 探测 中 的 性 能 进行 了 研究 。 


3 数据 集 


文中 的 数据 集 通过 开源 程序 ggwd 生成 ” 。 数 据 集 和 包括 两 类 ， 一 类 仅 包 含 LIGO 真实 
噪声 ， 另 一 类 包含 噪声 加 引力 波 。 噪 声 从 Hl 数据 中 随机 获取 (不 包括 探测 事件 )， 引 力 波 
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信号 通过 SEOBNRv4 波形 近似 方法 生成 。 每 条 训练 数据 的 时 间 长 度 为 1 s， 采 样 频率 为 
4096 Hz， 数 据 集中 引力 波 波源 参数 和 信 噪 比 参 数 范围 示 于 表 1。 图 1 展示 了 两 类 数据 示例 ， 
Class 0 仅 包 含 探测 器 噪声 ，Class 1 为 探测 器 噪声 注入 引力 波 信号 。 在 使 用 SEOBNRv4 模 
型 进行 双 黑洞 并 合 波形 仿真 时 ， 我 们 把 引力 波源 距离 定 为 恒定 值 100 Mpc。 但 是 这 个 波源 距 
离 在 最 终 的 引力 波 加 噪声 合成 信号 中 失去 意义 ， 因 为 双 黑 洞 并 合 引力 波 信号 在 注入 到 背景 
噪声 前 ， 根 据 预定 义 好 的 信 噪 比 进 行 了 缩放 处 理 。 


表 1 数据 生成 参数 


参数 名 称 数据 分 布 
双 黑 洞 并 合 质 量 (5 ~ 80)Mo 内 均匀 分 布 
并 合 黑 洞 自 旋 分 量 0 ~ 0.998 之 间 均 匀 分 布 
TRAM IRA 对 空间 方位 均匀 采样 
极 化 角 0 ~ 2r 之 间 均 匀 分 布 
相位 和 倾角 从 球体 上 的 均匀 分 布 中 联合 采样 
注入 信 噪 比 5 ~ 20 之 间 均 匀 分 布 


t/s 
b) 


YE: a) Class 0， 只 包含 噪声 的 信号 ; b) Class 1， 蓝 色 为 噪声 与 致密 双星 并 合 引力 波 登 加 的 信号 ， 橙 色 为 引力 
波 信号 。 图 中 两 类 信号 中 的 噪声 不 同 。 


图 1 白化 的 应 变 信号 


202306.00378v1 


chinaXiv 


ChinaXiv 合 作 期 刊 


264 天 文学 进展 40 卷 


4 深度 学 习 引力 波 探测 模型 


本 文 使 用 的 深度 学 习 引 力 波 探测 模型 包括 输入 模块 、 隐 藏 模块 、 输 出 模块 。 输 入 模块 接 
收 白化 的 应 变数 据 ， 输 出 通过 全 连接 和 Softmax 激活 函数 获得 二 分 类 的 值 。 隐 藏 模块 通过 
基本 单元 的 堆积 构成 ， 基 本 单元 通过 卷 积 、ReLU 激活 、 最 大 池 化 构建 ， 如 图 2 所 示 。 本文 
中 讨论 的 模型 的 网 络 复杂 度 由 基本 单元 中 卷 积 核 的 大 小 、 卷 积 核 的 数量 和 模型 中 基本 单元 
的 数量 共 3 个 参数 确定 。 隐 藏 层 中 基本 单元 的 数量 可 以 确定 模型 的 深度 ， 基 本 单元 中 卷 积 核 
的 数量 可 以 确定 模型 的 宽度 。 另 外 ， 我 们 还 对 最 后 一 层 基 本 单元 通过 BN 优化 进行 了 研究 。 
图 3 展示 了 有 具有 三 个 基本 单元 构成 的 引力 波 探测 模型 的 系统 框图 。 表 2 列 出 了 本 文 研究 模型 
的 参数 取 值 。 


2 ”隐藏 层 基本 模块 示意 图 


1 [ 基 基 基 A 
输 | 1 | 本 本 本 Sm| | | 输 
入 | 单 单 单 连 ax} | H 
| | 无 元 元 Be | 
\ al 


iE: a) 无 BN 优化 ，b) 有 BN 优化 。 
3 ”三 个 基本 模块 构成 的 引力 波 探测 模型 的 系统 框图 
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5 实验 结果 
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表 2 ”模型 参数 取 值 
参数 模型 深度 模型 宽度 卷 积 核 大 小 
取 值 1, 2, 3, 4, 5, 6, 7, 8 8, 16, 32 8, 16 
习 引 力 波 探测 模型 不 但 与 模型 结构 有 关 ， 而 且 与 训练 集 的 规模 有 关 。 本 文中 所 有 


实验 通过 四 种 规模 的 训练 集训 练 ， 分 别 是 4800, 20 000, 35000, 50000， 模 型 的 最 优 深度 随 
训练 集 规模 的 变化 如 表 3 和 表 4 所 示 。 当 卷 积 核 大 小 为 8 和 16 时 ， 最 优 模 型 的 训练 规模 都 
是 50000， 所 以 本 文 后 续 内 容 基 于 规模 为 50 000 的 训练 集训 练 得 到 的 模型 展开 研究 。 


表 3 卷 积 核 大 小 为 8 时 模型 的 最 优 深度 随 训练 集 规模 和 模型 宽度 的 变化 


模型 宽度 
训练 集 规模 8 16 32 
最 优 深度 ”准确 率 | 最 优 深度 ”准确 率 | 最 优 深度 EK 
4 800 6 91.58% 5 92.49% 3 92.83% 
20 000 7 94.39% 6 94.09% 5 94.02% 
35 000 7 93.43% 5 93.56% 4 93.26% 
50 000 6 93.43% 4 94.86% 3 94.87% 


RA 卷 积 核 大 小 为 16 时 模型 的 最 优 深度 随 训练 集 规模 和 模型 宽度 的 变化 


模型 宽度 
训练 集 规 模 8 16 32 
最 优 深度 ”准确 率 | 最 优 深度 ”准确 率 | 最 优 深度 准确 率 
4 800 6 91.49% 5 92.99% 4 92.16% 
20 000 6 94.23% 3 93.83% 4 94.02% 
35 000 7 93.43% 5 93.56% 4 93.26% 
50 000 6 94.17% 5 94.58% 4 95.10% 


51 “模型 深度 和 宽度 对 引力 波 探测 的 影响 


调整 卷 积 核 大 小 、 模 型 宽度 、 模 型 深度 构建 深度 网 络 模型 ， 对 模型 
5 和 表 6 列 出 测试 结果 。 通 过 实验 我 们 可 以 看 出 ， 模 型 每 


+ 进行 训练 、 


测试 ， 表 


屋 卷 积 核 数量 越 多 (宽度 越 宽 )， 最 


优 深度 就 越 小 。 例 如 ， 当 卷 积 核 大 小 为 8 时 ， 模 型 宽度 为 8 的 最 优 深度 为 6， 模 型 宽度 为 32 
深度 仅 为 3。 这 说 明 可 以 通过 综合 对 模型 的 深度 和 宽度 优化 来 得 到 更 优 的 探测 


的 最 优 模型 
模型 。 


5.2 BN 优化 对 引力 波 探测 的 影响 


另外 ， 我 们 还 对 最 后 一 层 基 本 单元 后 加 入 batch normalization (BN) 247 T 4 


BN 层 后 , 4 


究 了 不 同 深度 模型 的 引力 波 探 测 能 力 。 


图 4 展示 了 加 入 BN 前 后 


究 。 加 入 


引力 波 探测 准 
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表 5 卷 积 核 大 小 为 8 时 不 同 深度 和 宽度 模型 引 
力 波 探测 精度 (H1 训练 集 规模 为 50 000) 
宽度 
深度 8 16 32 
49.33% 50.66% 50.66% 
50.66% 49.33% 49.33% 
92.94% 93.88% 94.87% 
92.85% 94.86% 94.32% 
93.01% 94.63% 94.85% 
93.43% 94.73% 93.14% 
93.07% 94.10% 94.60% 
93.18% 94.08% 94.22% 


o s1 oan A wn er 


ChinaXiv 合 作 期 刊 


学 进展 40 郑 


表 6  ” 卷 积 核 大 小 为 16 时 不 同 深度 和 宽度 模型 引 
力 波 探测 精度 (H1 训练 集 规 模 为 50 000) 
宽度 
深度 8 16 32 
50.66% 50.66% 49.33% 
49.33% 49.33% 50.66% 
92.53% 92.24% 94.52% 
91.93% 93.65% 95.10% 
93.61% 94.58% 94.85% 
94.17% 94.27% 94.73% 
86.36% 94.02% 94.42% 
93.80% 94.07% 94.35% 


o sy oan A UONE 


确 率 随 模型 深度 的 变化 。 我 们 发 现 添加 BN 层 对 深度 为 1 和 2 的 引力 波 探 测 模型 的 探测 精度 


有 很 大 的 提升 ， 如 当 模 型 深度 为 1 时， 探测 精度 由 51% 提升 到 94%。 由 本 文 第 2 章 分 析 可 


知 ， 深 度 为 1 的 卷 积 神经 网 络 可 以 看 作 匹 配 滤波 法 后 接 全 连接 层 ， 本 实验 的 效果 提供 了 优化 
匹配 滤波 法 的 新 思路 ， 也 许 能 够 通过 BN 层 和 全 连接 层 改进 匹配 滤波 ， 保 持 探测 性 能 的 同时 
使 模板 数量 大 大 减 小 ， 达 到 实时 探测 。 图 5 展示 了 加 入 BN 前 后 不 同 深度 的 模型 在 测试 集 上 
的 ROC 曲线 。 从 图 4 和 图 5 的 综合 分 析 ， 我 们 发 现 BN 在 深层 特征 优化 方面 效果 欠 佳 ， 甚 


至 降低 网 络 的 探测 效果 。 


92 92 
89 


探测 准确 率 


Ha 加 入 BN 前 
Hay 加 入 BN 后 


93 94 94 93 94 94 94 92 94 94 


4 5 
模型 深度 


4 MA BN 前 后 引力 波 探测 准确 率 随 模 型 深度 的 变化 (背景 噪声 为 Hl 数据 ) 
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E 
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th 19 | 一 
0. ri --- 深度 为 1 优化 前 一 深度 为 4 优化 前 
2” 一 深度 为 1 优化 后 一 深度 为 4 优化 后 


EN 
ES 
E 
HK 
im ji 
0.2 --- 深度 为 6 优化 前 --- 深度 为 8 优化 前 
一 深度 为 6 优化 后 一 深度 为 8 优化 后 
00 02 04 06 08 1000 02 04 06 08 1.0 
虚 警 概率 虚 警 概率 


5 ”加 入 BN 前 后 不 同 深度 的 模型 在 测试 集 上 的 ROC 曲线 (背景 噪声 为 H1 数据 ) 


为 了 探索 BN 层 对 不 同 深度 模型 的 影响 是 否 与 不 同 探测 器 的 工作 状态 有 关 ， 我 们 使 用 
L1 探测 器 噪声 数据 ， 并 采用 与 上 文 相同 方法 对 模型 进行 训练 、 测 试 。 通 过 实验 ， 我 们 得 到 
与 H1 数据 类 似 的 结果 。 图 6 展示 了 在 L1 背景 噪声 下 加 入 BN 前 后 引力 波 探测 准确 率 随 模型 
深度 的 变化 ， 由 图 可 知 ， 单 卷 积 层 神经 网 络 在 加 入 BN 后 探测 准确 率 由 50% 提高 到 91%. 
5.3 加 入 BN 层 后 网 络 模型 泛 化 性 研究 

此 外 ， 为 了 验证 加 入 BN 层 后 网 络 模型 的 泛 化 能 力 ， 我 们 使 用 Hl 背景 噪声 数据 训练 的 
模型 来 对 L1 背景 噪声 合成 的 数据 进行 测试 ， 有 基体 测试 结果 如 图 7 所 示 。 我 们 发 现 HI 数据 
训练 的 模型 能 够 应 用 于 L1 数据 的 探测 ， 但 是 泛 化 能 力 有 所 降低 ， 如 对 于 单 层 神经 网 络 在 
H1 数据 中 的 探测 准确 率 为 94%, E L1 数据 中 的 探测 准确 率 降低 为 89%。 


6 结 论 


引力 波 探测 对 研究 黑洞 的 起 源 和 演化 等 有 重要 的 意义 。 本 文 对 不 同 深度 和 宽度 超 参数 
空间 的 卷 积 神经 网 络 应 用 于 引力 波 探测 进行 了 研究 ， 为 了 排除 训练 集 规模 的 影响 ， 我 们 采用 
四 种 规模 的 训练 集 进行 训练 ， 分 别 是 4800, 20000, 35000, 50 000。 通 过 实验 我 们 发 现 ， 模 
型 每 层 卷 积 核 数量 越 多 (宽度 越 宽 )， 最 优 深度 就 越 小 。 可 以 通过 综合 调整 模型 的 深度 和 宽 
度 来 优化 探测 模型 的 性 能 。 不 经 过 BN 提升 技术 优化 的 单 层 和 双 层 模型 的 引力 波 探测 效果 很 
差 ， 在 加 入 BN 优化 后 ， 单 层 和 双 层 卷 积 神经 网 络 引力 波 探测 效果 大 大 提升 ， 从 50% 左右 
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图 7 HI 数据 训练 模型 对 LL1 数据 泛 化 性 能 测试 结果 
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提升 为 90% 以 上 。 本 文 的 结果 为 匹配 滤波 模板 数量 的 压缩 提供 了 潜在 的 新 方法 ， 匹 配 滤波 
后 通过 BN 层 和 全 连接 层 也 许 能 够 大 大 减少 匹配 模板 数量 。 由 于 多 层 卷 积 神经 网 络 模 型 的 全 
连接 层 前 加 入 BN 优化 的 探测 准确 率 可 能 降低 ， 因 此 BN 层 所 在 的 深度 能 够 影响 探测 效果 。 


ut 
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Research on the Influence of Network Structure Complexity 


on Deep Learning for Gravitational Wave Detection 
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LI Wei-jun?, YI Jian-bing! 


(1. Jiangri University of Science and Technology, Ganzhou 341000, China; 2. University of South 
China, Hengyang 421200, China) 


Abstract: Deep learning for gravitational wave detection has been a hot spot in recent 
years. The matched filtering method can be regarded as a neural network with a single 
convolutional layer, and the template is stored in the convolution kernel. By increasing the 
depth of the model, similar detection effects can be obtained while the parameter number 
is greatly reduced. We study the deep learning gravitational wave detection models with 
different convolution kernel sizes, convolution kernel number, and convolution layer number. 
In addition, we investigate the detection effect of the model with batch normalization before 
the fully connected layer, and find that the detection accuracy of the model with a single 
convolutional layer increase from about 50% to more than 90% when the batch normalization 
is applied. A potential new method is provided for the compression of the number of matched 
filtering templates. By adding BN and full connection layer after matching filter, the number 
of matching templates may be greatly reduced. The generalization ability of the optimized 
CNN models on different background noise is also investigated. We find that the model 
trained by the data with H1 background noise can be used to detect the data with L1 


background noise, but the accuracy is slightly reduced. 


Key words: binary black hole merger; gravitational wave detection; deep learning 


